智能论文笔记

Learning GFlowNets from partial episodes for improved convergence and stability

Kanika Madan , Jarrid Rector-Brooks , Maksym Korablyov , Emmanuel Bengio , Moksh Jain , Andrei Nica , Tom Bosc , Yoshua Bengio , Nikolay Malkin

分类：机器学习 | (统计)机器学习

2022-09-26

生成流动网络（GFLOWNETS）是一种算法家族，用于训练在非均衡目标密度下离散对象的顺序采样器，并已成功用于各种概率建模任务。现有的Gflownets培训目标是国家本地的，或者是过渡的本地，或者在整个采样轨迹上传播奖励信号。我们认为，这些替代方案代表了梯度偏见变化权衡的相反目的，并提出了一种利用这种权衡以减轻其有害影响的方法。受到强化学习的TD（$ \ lambda $）算法的启发，我们介绍了一个subtrajectory Balance或subtb（$ \ lambda $），这是一个GFLOWNET培训目标，可以从不同长度的部分动作子序列中学习。我们表明，SubTB（$ \ lambda $）会在先前研究和新环境中加速采样器的收敛，并在具有更长的动作序列和比以前的可能性更长的环境中培训Gflownets。我们还对随机梯度动力学进行了比较分析，阐明了GFLOWNET训练中的偏差变化权衡以及亚条件平衡的优势。

translated by 谷歌翻译

对于大型小分子的大型库，在考虑一系列疾病模型，测定条件和剂量范围时，详尽的组合化学筛选变得不可行。深度学习模型已实现了硅的最终技术，以预测协同得分。但是，药物组合的数据库对协同剂有偏见，这些结果不一定会概括分布不足。我们采用了使用深度学习模型的顺序模型优化搜索来快速发现与癌细胞系相比的协同药物组合，而与详尽的评估相比，筛查要少得多。在仅3轮ML引导的体外实验（包括校准圆圈）之后，我们发现，对高度协同组合进行了查询的一组药物对。进行了另外两轮ML引导实验，以确保趋势的可重复性。值得注意的是，我们重新发现药物组合后来证实将在临床试验中研究。此外，我们发现仅使用结构信息生成的药物嵌入开始反映作用机理。

translated by 谷歌翻译